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(§) Chromatin-Regulatorgene 

@ Die Deregulation von Chromatinregulator-Genen, die eine 
SET-Domane aufweisen, spiolt eine Rolle bei bestimmten 
Krebserkrankungen. Diese Gene konnen somit, insbesonde- 
re die SET-Dom3ne als soiche, ais Grundlage fur die 
Diagnose und Therapie dieser Erkrankungen dienen. 
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Beschreibung 

Die vorliegende Erfindung bezieht sich auf Gene, die 
eine Rolle bei der Regulation von Chromatin spielen, 
und ihre Verwendung fur die Therapie und Diagnostik. 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere, Telomere sowie in eu- 
und heterochromatische Regionen stellt einen entschei- 
denden Mechanismus zur Gewahrieistung der genauen 
Replikation und Verteilung der genetischen Informa- 
tion bei jeder Zellteilung dar. Im Gegensatz dazu sind 
Tumorzellen haufig durch chromosomale Rearrange- 
ments, Translokationen und Aneuploidie charakterisiert 
(Solomon et al, 1991 ; Pardue, 1991). Obwohl die Mecha- 
nismen, die zu einer erhdhten Chromosomeninstabilitat 
in Tumorzellen fiihren, noch nicht geklart sind, haben es 
in jQngster Zeit eine Reihe von experimentellen Syste- 
men, beginnend mit telomerischen Positionseffekten in 
Hefe (Renauld et aL, 1993; Buck und Shore, 1995; Allshi- 
re et aL, 1994X uber Positionseffekt- Variegation (PEV) 
in Drosophila (Reuter und Spierer, 1992), bis zur Analy- 
se von Translokationsbruchpunkten in humanen Leuka- 
mien (Solomon et aL, 1991; Cleary, 1991), ermoglicht, 
einige chromosomale Proteine zu identifizieren, die an 
der deregulierten Proliferation ursachlich beteiligt sind. 

Erstens wurde festgestellt, daB die Oberexpression 
einer verkiirzten Version des SIR4-Proteins zu einer 
verlangerten Lebensdauer in Hefe fOhrt (Kennedy et aL, 
1995). Da SIR-Proteine zum Entstehen multimerer 
Komplexe an den stillen "Mating Type Loci" und am 
Telomer beitragen, k6nnte es sein, daB iiberexprimier- 
tes S1R4 mit diesen heterochromatinartigen Komplexen 
interferiert, was schlieBlich zu einer unkontrollierten 
Proliferation fOhrt Diese Annahme steht im Einklang 
mit der Haufigkeit des Auftretens einer deregulierten 
Telomerenlange in den meisten humanen Krebsarten 
(Counter etaL.1992). 

Zweitens wurden mittels genetischer Analysen von 
PEV in Drosophila eine Reihe von Genprodukten iden- 
tifiziert, die die Chromatinstruktur an heterochromati- 
schen Positionen und innerhalb des homeotischen Gen- 
clusters verandern (Reuter und Spierer, 1992). Mutatio- 
nen einiger dieser Gene, wie modulo (Garzino et al, 
1992) und polyhomeotic (Smouse und Perrimon, 1990), 
kSnnen in Drosophila die deregulierte Zellproliferation 
oder den Zelltod verursachen. Drittens wurden Sauge- 
tierhomologe von sowohl Aktivatoren (trithorax oder 
trx-Gruppe) als auch Repressoren (z. B. polycomb oder 
Pc-Gruppe) der Chromatinstruktur von homeotischen 
Drosophila-Selektorgenen beschrieben. Unter diesen 
hat sich vom humanen HRX/ALL-1 (trz-Gruppe) ge- 
zeigt, daB es an der durch Translocation induzierten 
Leukamogenese beteiligt ist (Tkachuk et aL, 1992; Gu et 
aL, 1992), und daB die Oberexpression des Maus-bmi 
(Pc-Gruppe) zum Entstehen von Lymphomen ftthrt 
(Haupt et aL, 1991; Brunk et aL, 1991; Alkema et al, 
1995). Ein Modell fur die Funktion chromosomaler Pro- 
teine last darauf schlieBen, daB diese multimere Kom- 
plexe bilden, welche in Abhangigkeit von der Ausgewo- 
genheit zwischen Aktivatoren und Repressoren im 
Komplex den Kondensationsgrad der umliegenden 
Chromatinregion bestimmen (Locke et al, 1988). Eine 
Verschiebung dieses Gleichgewichts durch Oberexpres- 
sion einer der Komponenten des Komplexes zeigte eine 
Neuverteilung von en- und heterochromatischen Regio- 
nen (Buck und Shore, 1995; Reuter und Spierer, 1992; 
Eissenberg et aL, 1992). Dieser Dosiseffekt kann die 
Chromatinstruktur an vorbestimmten Loci destabilisie- 
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ren, was letztlich zu einem Obergang vom normalen 
zum transformierten Zustand fuhrt 

Trotz der Charakterisierung von HRX/ALL-l und 
bmi als Protoonkogene, die die Chromatinstruktur ver- 
5 andern kdnnen, ist das Wissen Qber Saugetiergenpro- 
dukte, welche mit Chromatin wechselwirken, noch sehr 
beschrankt Im Gegensatz dazu wurden durch geneti- 
sche Analysen von PEV in Drosophila ca. 120 Allele fur 
Chromatinregulatoren beschrieben (Reuter und Spie- 

io rer, 1992). Kiirzuch wurde eine carboxyterminale Re- 
gion mit Ahnlichkeit in der Sequenz identifiziert, die 
einem positiven (trx, trx-Gruppe) und eine negativen 
(E(z), Pc-Gruppe) Drosophila-Chromatinregulator (Jo- 
nes und Gelbart, 1993) gemeinsam ist. Daruberhinaus ist 

15 dieser Carboxyterminus auch in Su(var)3— 9, einem do- 
minanten Supressor der Chromatinverteilung in Droso- 
phila, konserviert(Tschiersch et aL, 1994). 

Bei der vorliegenden Erfindung wurde von der Ober- 
legung ausgegangen, daB diese als "SET" bezeichnete 

20 Proteindomane (Tschiersch et al, 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein 
in antagonistischen Genprodukten eine neue Genfami- 
lie entwicklungsgeschichtlich wichtiger Saugetier-Chro- 
matinregulatoren definiert. Daruberhinaus tragt die 

25 Charakterisierung weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufkla- 
rung der Mechanismen bei, die dafflr verantwortlich 
sind, daB strukturelle Veranderungen im Chromatin zur 
malignen Transformation fQhren konnen. 

30 Der vorliegenden Erfindung lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu identifi- 
zieren, ihre Funktion aufzuklaren und sie fur die Dia- 
gnostik und Therapie einzusetzen. 
Zur Losung dieser Aufgabe wurde zunachst die Se- 

35 quenzinformation der SET-Domane benutzt, um aus hu- 
manen cDNA-Banken die zu den SET-Domane-Genen 
von Drosophila homologen humanen cDNAs zu erhal- 
ten. Es wurden zwei cDNAs erhalten, die Humanhomo- 
loge von E(z) bzw. Su(var)3-9 darstellen; die entspre- 

40 chenden humanen Gene wurden als HEZ-2 und H3— 9 
bezeichnet (vgL unten); auBerdem wurde eine variante 
Form von HEZ-2 identifiziert, die als HEZ-1 bezeichnet 
wurde. 

Die vorliegende Erfindung betrifft somit DNA-Mole- 

45 kiile, enthaltend eine far ein Chromatinregulator-Prote- 
in, das eine SET-Domane aufweist, kodierende Sequenz 
oder eine Teilsequenz davon, dadurch gekennzeichnet, 
daB sie die in Fig. 6 oder in Fig. 7 dargestellte Nukleo- 
tidsequenz aufweisen. Die erfmdungsgemaBen DNA- 

50 MoIekUle werden im folgenden auch als "erfindungsge- 
maBe Gene" bezeichnet 

Die erfindungsgemaBen Gene tragen die Bezeich- 
nung HEZ-2 und H3-9. 
Die Erfindung betrifft in einem weiteren Aspekt die 

55 von diesen Genen abgeleiteten cDNAs, einschlieBlich 
ihrer degenerierten Varianten; Mutanten, die fur funk- 
tionelle Chromatinregulatoren kodieren sowie Varian- 
ten, die auf eine Genduplikation zuruckzufQhren sind; 
ein Beispiel dafilr ist HEZ-1, dessen Sequenz im Ver- 

eo gleich mit HEZ-2 in Fig. 8 dargestellt ist 

Zur Losung der im Rahmen der vorliegenden Erfin- 
dung gestellten Aufgabe wurde im einzelnen wie folgt 
vorgegangen: Ausgehend von der Sequenzinformation 
von der konservierten SET-Domane, wurde unter redu- 

65 zierter Stringenz eine humane B-Zell-spezifische 
cDNA-Bibliothek mit einer gemischten Drosophila- 
DNA-Sonde, die fur die SET-Domanen von E(z) und 
Su(var)3-9 kodiert, gescreent Aus 500.000 Plaques 
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wurden 40 primire Phagen ausgewahlL Nach zwei wei- zwei getrennte Loci kodiert werdea Der zweite HEZ- 
teren Runden Screening zeigte sich, daB 31 Phagen fQr Locus (als HEZ-1 bezeichnet) wurde auch durch Cha- 
authentische E(z)-Sequenzen kodieren und daB fiinf rakterisierung einer kleinen Anzahl von cDNA-Varian- 
Phagen E(z)-Vananten darstellea Im Gegensatz dazu ten, die sich in ihren 3'-flankierenden Sequenzen von der 
hybndisierten nur zwei Phagen mit der Sonde die die 5 Mehrzahl der aus der humanen cDNA-Bibliothek iso- 
SET-Domane von Su(yar)3-9 allein enthielt Die Pha- iierten HEZ-Klone unterscheiden, bestitigt Die Unter- 
geninserts wurden mittels Polymerasekettenreaktion schiede zwischen HEZ-2 und HEZ-1 im sequenzierten 
(PCR) amplifiziert und mitteis Restriktionskartierung Bereich sind in Fig. 8 dargestellt: Die SET-Domane von 
Xa^ eqUena f rUDg mal y siert Reprasentative HEZ-1 zeigt gegenuber HEZ-2 Mutationen; auDerdem 
SSl^ X,- 10 hatHEZ " lin der SET-Domane ein Stopoodon, das das 

subkloniert und fiber ihre ganze Lange sequenziert Die Protein urn die 47 C-terminalen Aminosauren verkurzt 
5 -Enden wurden isoheru indem positive Phagen noch In Kg. 8 ist die Nukleotidsequenz der HEZ-2-cDNA 
-. DNA - S , onden gescreent wurden, worauf von Position 1844 bis 2330 in der jeweils oberen Zeiie 
nach Subklonierung komplette cDNAs erhalten wur- dargestellt, wobei das authentische Stopcodon unter- 
5r. , , . J , is strichen ist Um eine Teilsequenz der cDNA der HEZ- 

Die komplette, fur das humane Homologe von E(z) 1-Variante der HEZ-2-Sequenz zuzuordnen wulde das 
kodierende cDNA wurde als HEZ-2 und die DNA, die gap-Programm des Wisconsin G?SSS 
215 flTo^T r? S <™*7 9 kodi ^ verwend <* Das vorzeitige Stopcodon in HEZ-1 (Pos* 
a™ be f 1ChDet ***** ^ tion 353) ist unterstrichea Sequenzen, die fur die kon- 

Identitat der Ammosauren zwischen Drosophila und 20 servierte SET-Domane kodieren, sind hervorgehobea 
den humanen Proteinen 61% fflr HEZ-2 und 43% fur AuBerdem ist das 3'-Ende (PositionTsi b HEZ 3)£ 
H3-9, wobei die atermmaie SET-Domane sehr hoch aberranten Transkripts B52 (s. unten) dargestellt. Ober 
konserviert ist (SWA fflr HEZ-2 und 53% fur H3-9). die verfflgbare Sequenz zeigte sicX fu 5% £ 
Der Sequenzvergleich zeigte weitere deutliche Homo- tisch mit HEZ-1 und zu 72% identisch mit HEzV Der 
HF7 r ^H^ erne Cystem-reiche Domane in 25 Sequenzvergleich von HEZ-1 mit HEZ-2 sowie die Fest- 
HEZ-2 und eine Chromo-Box in H3-9. (In polycomb stellung, daB beim Menschen im Gegensatz zur Maus 
wjrde Sezeigt^ : daB die Chromo-Box die fflr die Wech- zwei getrennte HEZ-Loci auftreten, Iassen daraS 
£^T hen DN A ^L^ T ? m T wesentUche schli ^en, daB beim Menschen eine Genduplikation auf- 
Domane 1st; Messmer et al, 1992). Im Gegensatz dazu getreten sein dflrf te 

CT^nl™^ 0 /^"' ^^^^oterminale 30 In einem Vergleich mit cDNA-Sequenzen in der Da- 
GTP-Bindungsmotiv des DrosopMa-Proteins enthal- tenbank GeneBank wurde fiberraschend festgestellt 

te ^cr en h h H™r nHo f ol T nH3 - 9 - . daB bestimmte in der Datenba ^ Sis 

n3?f ^r.A^osaure-Sequenzen zwischen Teilsequenzen, die von aberranten Trenskripten in Tu- 

Fto ESSi^Et UmaDen GenCn 1$t m den ? orgeweben ab 8 eleitet ^ mutierte Versionen der er- 
Hg.1 und 2 : dargestellt: 3S findungsgemaBen cDNAs darstellen: 

JK. Z f&* o n ^ er « lei ^ h d er Aminosaure-Sequenz Einerseits war auf der Suche nach BRCA1, einem 
S?SS ih 5 T - Dr0 f P hlla ; enh , ancer v ? n 2e " G^, das fflr Brust- und Eileiterkrebs pradisponiert, eine 
ShSrSnT ^J^T 05 ^? ^.konservjerten partielle cDNA-Sequenz mit 271 Nukleotiden der Be- 
c^boxvterminalen SET-Domane (schattierte Box) und zeichnung B52, die fur eine mutierte Variante der SET- 
der Cys-reichen Region (Cys-Reste smd hervorgeho- 40 Domane kodiert, isoliert und auf dem humanen Chro- 
ben) sind gezeigt Die mutmaBhchen Kernlokalisie- mosom 17q21 kartiert worden (Friedman et aL, 1994). Es 
^^"d^rsmchea wurde im Rahmen der vorliegenden Erfindung flberra- 

JS* a S d Vergleich der Aminosaure-Sequenz schend festgestellt, daB B52 97% Identitat mit der erfin- 
3STS£5 h ™™ a "™<*°&» H3-9undDroso- dungsgemaBen HEZ-1 -cDNA-Variante aufweist (vgL 
phila-Su(var)3-9. Identische Ammosauren der konser- 45 oben); mfiglicherweise stellt HEZ-1 ein Pseudogen dlr 
vierten carboxytermmalen SET-Domane (schattierte dessen Reaktivierung bei der deregulierten ProliferT 
Box) und der Chromo-Domane (dunkler schattierte tion eine Rolle spielt guienen t-rowera 

( ? arges J ellt t Die P" tm ^hen Kernlokalisie- Andererseits war eine cDNA (2500 Nukleotide; MG- 
f^^-T 1 !^ K° b -f n f S dCr FigU f kt 44) vom humanen Chromosom Xpll isoliert worden 
erne schemausche Obersicht der beiden Protemstruktu- so (Geraghty et aL, 19931 einer Region, die fiir degenerati- 
on dargestellt, die zeig^daB im humanen Homologen ve StoUgen der Neihaut und S^iS£!Z prl 
207 Ammosaurenam N-Terminusfehlea disponiert. Es wurde uberraschend festgestellt, daB die- 

aJ?IT< v ^ nsens ^equ e nzen in Umgebung se cDNA 98% Identitat mit der erfindungsgemaBen 
de Start-ATG der humanen H3-9-CDNA auch an der H3-9-cDNA aufweist. (Der Sequenzverllfich der 

^n^? l l S ^~ 9 r or - * H3-9-cDNA mit ihrermutierten Version MG-44zeS 

SSilf^ Drosophila-Protein zusatzliche daB diese ebenfalls nicht das am 5'-Ende gelegene GTF^ 

&iSr5f^r i ^ - emem StadlUm der Bindun g sn ><>tiv des Drosophila-Homologen aufweist.) 

iStSt JL C J < Unk T f tbebrl,cb . wurd !«- < Die Di « ™ Rahmen der vorliegenden Erfindung bereitge- 

£m dfilTiS^^nM^J 5 ? ta T Werd /"' m ' steI,ten neuen Gene ermsghchen es somit efstmals, ei- 

?Fnl vTf t H nM; CDNA cT d ^ mp n I ^ oderam 60 nen Z^ammenhang zwischen bestimmten Kreb er- 

5 -Ende verkflrzte cDNAs von Su(var)3-9 in Drosophi- krankungen und Mutationen in Chromatinregulatoren 

BeSS Si" ? T d K e T Weher ? f N \ der herzuleiten = ™ Falle der MG-44-cDNA 

MsdafsTndl?^^ teCben ^ ^ ^ m ^ n ^ Und F "meshift- Mutationen aufweist, 

iJT , I , ^ welche die Chromo- und SET-Domanen unterbrechen 

, ^^^^^^^«^^>g^ es erst anhand der erfindungsgemaBen H3-9-cDNA eTn 

te DNA-Blot-Analysen deuten darauf hin, daB HEZ und Zusammenhang zwischen s5(var)3- 9 und MG-4Vauf- 

H3-9 m der Maus von einzelnen Genen reprasentiert geklart werdea 

werdea wahrend im Menschen HEZ-Sequenzen durch Neben den bereits genannten Sequenzen sind in der 
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Sequenzdatenbank GeneBank als weitere humane Mit- 
glieder der SET-Proteinfamilie das gut dokumentierte 
humane Homologe von Drosophila trx, HRX/ALL-1 
(Tkachuk et al, 1992; Gu et aL, 1992) eingetragen, feraer 
ein Gen unbekannter Funktion der Bezeichnung G9a, 
das im humanen Major Histocompatibility Complex 
(Milner und Campbell, 1993) vorhanden ist drittens eine 
nicht publizierte cDNA (KG-1), die aus unreifen myeloi- 
den Tumorzellen isoliert wurde (Nomura et aL, 1994). 
Wahrend G9a derzeit das einzige humane Gen mit einer 
SET-Domane ist, fiir das bisher keine mutierte Version 
bekannt ist, tragt KG-1 eine Insertion von 342 Amino- 
sauren, welche die SET-Domane in eine Amino- und 
eine Carboxyterminale Haifte spaltet Ob diese KG- 
1-cDNA das authentische Gen oder eine aberrante Ver- 
sion darstellt, ist unklar. Insgesamt sind vier der fflnf 
derzeit bekannten humanen Mitglieder der SET-Pro- 
teinfamilie Anderungen unterworfen, die alle die SET- 
Domane mutieren (HRX/ALL-1, HEZ-1/B52, MG-44 
und KG-1). Darilberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Translokationsbruchpunkten oder instabilen chromoso- 
malen Regionen kartiert (HRX/ALL-1, HEZ-1/BS2 und 
MG-44). In Fig. 3 sind die aberranten Transkripte von 
humanen SET-Domane-Genen dargestellt Links in der 
Figur ist die Lage der fiinf derzeit bekannten SET-Do- 
mane-Gene auf dem jeweiligen Chromosom angegeben. 
Ua. sind die drei Gene (HRX/ALL-1, HEZ-1/B52 und 
MG-44), fur die aberrante cDNAs auf Translokations- 
bruchpunkten oder instabilen Chromatinregionen kar- 
tiert wurden, dargestellt Vier der fflnf dargestellten 
SET-Domane-Gene weisen Mutationen auf, die alle die 
Carboxyterminale SET-Domane unterbrechen, welche 
in der Figur durch die dunkle Box dargestellt ist Eine 
Translokation verbindet die aminoterminale Haifte von 
HRX mit einer nicht korrelierten Gensequenz, die als 
gepunktete Box mit der Bezeichnung ENL dargestellt 
ist Ein vorzeitiges Stopcodon verkurzt die SET-Doma- 
ne von HEZ-1/B52. Punkt- und Frameshift-Mutationen 
unterbrechen die Chromo- und SET-Domane in MG-44. 
Eine groBe Insertion spaltet die SET-Domane von 
KG-1 in zwei Halften. Aberrante Transkripte sind der- 
zeit fflr G9a nicht bekannt Das Cystein-reiche Cluster in 
B52 ist als gepunktete Box dargestellt; in HRX/ALL-1 
sind die Homologieregion zu Methyltransferasen als 
schraffierte Box und die A/T-Haken als vertikale Linien 
dargestellt Die Namen der jeweiligen authentischen 
Gene sind rechts in der Figur angegeben. 

Die Tatsache, daB ein Saugetiergen der SET-Protein- 
familie, HRX/ALL-1, mit translokationsinduzierter Leu- 
kamogenese im Zusammenhang gebracht wurde (Tka- 
chuk et aL 1992; Gu et aL 1992), ist ein starker Hinweis 
daf flr, daB Proteine mit SET-Domane nicht nur wichtige 
Regulatoren der Entwicklung sind, die chromatinabhan- 
gige Veranderungen der Genexpression mitbestimmen, 
sondern daB sie, nach Mutation, auch die normale Zell- 
prolif eration storen. 

Da alle bisher beschriebenen Mutationen die Primar- 
struktur der SET-Domane unterbrechen, liegt die Ver- 
mutung nahe, daB es die SET-Domane als solche ist die 
eine entscheidende Rolle im Obergang vom normalen 
zum transformierten Zustand spielt Eine wichtige 
Funktion fflr die SET-Domane kann ferner aufgrund 
ihrer evolutionaren Konservierung in Genprodukten, 
die von der Hefe bis zum Menschenauftreten, vermutet 
werdea 

Fig. 4 zeigt die evolutionare Konservierung von SET- 
Domane- Proteinen: Unter Verwendung des tfasta-Pro- 
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gramms des Wisconsin GCG Netzwerkservice wurden 
Proteine und offene Leserahmen mit Homologie zur 
SET-Domane identifiziert In der Figur ist eine repra- 
sentative Auswahl von Hefe bis zum Menschen gezeigt 
5 Ziffern geben Aminosauren an. Die Carboxyterminale 
SET-Domane ist durch eine schwarze Box dargestellt 
Cys-reiche Regionen durch einedunkel gepunktete Box, 
das GTP-Bindungsmotiv in Su(var)3-9 durch eine hell- 
gepunktete Box und die Chromo-Domane von 

io Su(var)3-9 und H3-9 durch eine offene Box mit hellen 
Punkten. Eine Region mit Homologie zu Methyltransfe- 
rase (trx und HRX) ist als schraffierte Box dargestellt 
A/T-"Haken'* ("A/T Hooks") sind durch vertikale Linien 
dargestellt Eine weitere Ser-reiche Region (S in 

15 C26E6.10) und eine Glu-reiche Region (E in G9a) oder 
Ankyrin-Repeats (ANK in G9a) sind ebenfalls hervor- 
gehobea YHR119 (GeneBank Accession No. U00059) 
und C26E6.10 (GeneBank Accession No. U 13875) sind 
offene Leserahmen von kurzlich in die Datenbank ein- 

20 getragenen Cosmiden ohne eine funktionelle Charakte- 
risierung. Prozente geben die Gesamtheit der Amino- 
saure-Identitaten zwischen den humanen und den Dro- 
sophila-Proteinen an. 
Fig. 5 zeigt die Obereinstimmung an Aminosauren 

25 der SET-Domane. Die SET-Domane der in Fig. 4 darge- 
stellten Gene wurde unter Verwendung des Pileup-Pro- 
gramms des Wisconsin GCG Netzwerkservice ange- 
ordnet Fflr den Vergleich der KG-l-SET-Domane wur- 
de vor dem Pileup die groBe Aminosaure-Insertion, die 

30 die SET-Domane in zwei Halften spaltet, entfernt Ami- 
nosaure-Positionen, die 8 von 10 Obereinstimmungen 
aufweisen, sind hervorgehoben. 

Aufgrund der im Rahmen der vorliegenden Erfindung 
festgestellten Kriterien erweist sich eine Beteiligung der 

35 Gene, die eine SET-Domane haben, an der chromatin- 
abhangigen Entstehung der deregulierten Proliferation; 
diese Gene bzw. die davon abgeleiteten cDNAs sowie 
Teil- und mutierte Sequenzen kfinnen somit bei der 
Therapie und Diagnose von Erkrankungen, die auf eine 

40 derartige Proliferation zurflckzufflhren sind, eingesetzt 
werden: 

Unterschiede im Transkriptionsniveau von SET-Do- 
mane-RNAs zwischen normalen und transformierten 
Zellen k6nnen als diagnostischer Parameter fflr Erkran- 

45 kungen herangezogen werden, in denen die Expression 
von SET-Domane-Genen dereguliert ist: 

So konnen Oligonukleotide, kodierend fflr die SET- 
Domane als solche bzw. Teilabschnitte davon, als dia- 
gnostischer Marker verwendet werden, um bestimmte 

50 Krebsarten, in denen die SET-Domane mutiert ist zu 
diagnostizieren. Fflr die detaillierte Analyse der Funk- 
tion der erfindungsgemaBen cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Eihsatz von 
SET-Domane-Gensequenzen wurden im Rahmen der 

55 vorliegenden Erfindung die homologen Maus-cDNAs 
von HEZ-2 und H3-9 isoliert Bei Verwendung der 
Maus-HEZ-cDNA als spezifische DNA-Sonde in "nu- 
clease SI protection" Analysen zur Untersuchung der 
HEZ-2-Genaktivitat wahrend der normalen Mausent- 

60 wicklung zeigte sich ein eher breites Expressionsprofil, 
das ahnlich dem von bmi (Haupt et aL 1991) ist Die mit 
den Maussequenzen durchgefuhrten Analysen werden 
mit Humansequenzen ausgeweitet um die RNA-Men- 
gen zwischen unreifen Voriauferzellen, Tumorzellen 

65 und differenzierten Zellen in verschiedenen humanen 
Zellkultursystemen zu vergleichen. Um festzustellen, ob 
sich die SET-Domane dementsprechend als diagnosti- 
scher Tumormarker fflr spezifische Krebserkrankungen 
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Oder als genereller diagnostischer Parameter eignet, sche Funktion hat, ahnlich der aminoterminalen BTB- 
k6nnen gangige Metfaoden zur Bestimmung der RNA- Domane verschiedener Chromatinregulatoren, ein- 
Konzentration, die in einschlagigen LaborhandbQchern schlieBlich des GAGA-Faktors (Adams et al, 1992). Ins- 
(Sambrook, J, Fritsch, EF. und Maniatis, T, 1989, Cold gesamt erlauben die Analysen von Wechselwirkungen 
Spring Harbor Laboratory Press) beschrieben sind, wie 5 mit Epitop-versehenen HEZ-2- und H3-9-Proteinen 
Northern Blot, Sl-Nuclease-Protection- Analyse oder eine weitere Charakterisierung der Funktion der SET- 
RNAse-Protection-Analyse,verwendet werden. Domane. Dadurch werden Mdglichkeiten erdffnet, ge- 

Um die HSufigkeit zu untersuchen, mit der die SET- gen die deregulierte Aktivitat vorzugehen, indem z. B. 
Domane spezifischen Mutationen unterliegt, kdnnen die mittels gentherapeutischer Methoden dominant-negati- 
SET-spezifischen DNA-Sonden zur Analyse von Einzel- 10 ve Varianten der SET-Domane-cDNA-Sequenzen in 
strang-Konformationspolymorphismen (single strand die Zelle eingefflhrt werden. Derartige Varianten wer- 
conformation polymorphisms; SSCP; Gibbons et al, den z. B. erhalten, indem zunachst die funktionellen Do- 
1995) eingesetzt werden. mgnen der SET-Proteine definiert werden, z. B. die fflr 

Krebsarten, bei denen SET-spezifische DNA-Sonden die DNA/Chromatin- oder die fflr die Protein/Protein- 
als diagnostischer Marker verwendet werden kOnnen, 15 Wechselwirkung verantwortlichen Sequenzabschnitte, 
sind Brustkrebs (HEZ-2; Friedman et al, 1994), Synovi- und indem dann die um die jeweilige(n) Domanefn) oder 
alksarkom (H3-9; Geraghty et aL; 1993) und Leuka- um Abschnitte davon verkilrzten DNA-Sequenzen in 
nu ^ IL . 1 . „ der betroffenen Zelle zur Expression gebracht werden, 

or™ Kenntms der Nukleotidsequenz der um eine durch das intakte funktionelle Protein verur- 

SET-Domane-Gene kdnnen die entsprechenden von 20 sachte Deregulation der Proliferation zu kompetitieren. 
der cDNA-Sequenz abgeleiteten Proteine, die ebenfalls Die Verfiigbarkeit der erfindungsgemaBen cDNAs 
GegenstanddervorhegendenErfindungsincLinrekom- erlaubt ferner die Herstellung transgener Tiere z B 
binanter Form herstellt werden, indem die dafiir kodie- Mause, in denen SET-Domane-Gene entweder flb'erex- 
renden cDNAs in geeignete Vektoren inseriert und in primiert werden kfinnen ("gain-of-function") oder in de- 
Wirtsorganismen exprimiert werden. Die fiir die Pro- 25 nen diese Gene ausgeschaltet werden konnen ("loss-of- 
duktion rekombinanter Proteine verwendeten Techni- function"); fflr letztere Analysen werden die korrespon- 
kensmddempurchschnittsfachmanngelaufigundkOn- dierenden Tiersequenzen, insbesondere Maussequen- 
nen einschiagigen Handbflchern (Sambrook, J, Fritsch, zen, der erfindungsgemaBen Gene eingesetzt 
E.F. und Maniatis, T, 1989, Cold Spring Harbor Labora- Insbesondere gibt die "gain-of -function"- Analyse bei 
tory Press) entnommen werden. 30 der Allele der erfindungsgemaBen Gene in die Maus 

Gegenstand der vorliegenden Erfindung sind somit in eingefflhrt werden, letztlich AufschluB fiber die ursachli- 
emem weiteren Aspekt rekombinante DNA-Molekflle, che Beteiligung von HEZ-2 und H3-9 an der chroma- 
enthaltend die fflr HEZ-2, H3-9 oder HEZ-1 kodieren- tinabhangigen FOrderung der Tumorentstehung. Fur 
de DNA sowie damit funktionell verbundene Expres- die "gain-of-function"-Analyse kdnnen die kompletten 
sionskontrollsequenzen, sowie die damit transformier- 35 cDNA-Sequenzen von humanem HEZ-2 und H3-9 so- 
ten Wirtsorganismen. wie deren mutierte Versionen, wie HEZ-1/B52 und MG- 

Die erfindungsgemaBen rekombinanten Proteine 44, mittels Vektoren, die hohe Expressionsraten erm6g- 
kdnnen eingesetzt werden, um die Wechselwirkung von lichen, z. B. Plasmiden mit dem humanen B-Actin-Pro- 
SET-Domane-Proteinen mit Chromatin bzw. mit ande- motor, getrieben sowohl vom Enhancer der schweren 
ren Mitgliedern von Heterochromatinkomplexen zu 40 KettevonImmunglobulinen(En)alsauchvonMoloney- 
analysieren; ausgehend von den dabei erhaltenen Er- Virus-Enhancern (Mo-LTR). Kurzlich wurde gezeigt 
kenntnissen flber die Wirkungsweise dieser Komplexe daB die Eji/Mo-LTR-abh3ngige Oberexpression des 
werden die sich im einzetoen ergebenden MOglichkeiten bmi-Gens, welches gemeinsam mit HEZ-2 zur Pc-Grup- 
ftir das gezielte Eingreifen in die daran beteiligten Me- pe negativer Chromatinregulatoren zahlt, ausreicht in 
chanismen definiert und kfinnen fflr therapeutische An- 45 transgenen Mausen Lymphome zu erzeugen (Alkema et 
wendungengenutzt werden. aL,1995). 

Untersuchungen, die der weiteren Analyse der Funk- Indem in "loss-of-function"-Analysen die endogenen 
tion der SET-Doraane dienen, werden z. B. durchge- Maus-Loci fflr HEZ-2 und H3-9 durch homologe Re- 
Rihrt, indem cDNAs, kodierend fflr humanes HEZ-2 kombination in embryonalen Stammzellen unterbro- 
bzw. H3-9 und versehen mit einem Epitop, gegen das 50 chen werden, kann bestimmt werden, ob der Verlust der 
Antikfirper zur Verfflgung stehen, in vitro sowie in Ge- in vivo-Genfunktion zu einer abnormalen Entwicklung 
webekulturen exprimiert werden. Nach Immunprazipi- der Maus fflhrt 

tation mit den jeweiligen epitopspezifischen AntikQr- Aufgrund dieser in vivo-Systeme kann die Wirkung 
pern kann festgestellt werden, ob HEZ-2 und H3-9 von HEZ-2 und H3-9 bestatigt werden; diese Systeme 
mitemander m vitro wechselwirken konnen und ob in 55 dienen auBerdem als Grundlage fur Tiermodelle im Hin- 
vivo erne Komplexbildung zwischen HEZ-2 und/oder buck auf eine humane Gentherapie. 
H3-9 mit weiteren Chromatinregulatoren stattfindet Der gentherapeutische Einsatz der erfindungsgema- 

Es wurde bereits von anderen Autoren angenommen Ben DNA-Sequenzen oder davon abgeleiteter Sequen- 
(DeCamiDis et aL, 1992; Rastelli et al, 1993; Orlando und zen (z. B. komplementarer Antisenseoligonukleotide) 
Paro, 1993), daB eme Komplexbildung zwischen ver- eo erfolgt - je nachdem, ob die zu behandelnde Erkran- 
schiedenen Mitghedern von Heterochromatinproteinen kung auf eine Deregulation von Chromatin infolge des 
wesentlich fflr deren Funktion isL Aufgrund der Verfflg- Fehlens der funktioneUen Gensequenz, oder aber infol- 
barkeit der erfindungsgemaBen SET-Domane-Gene ge einer Oberexpression der entsprechenden Gene oder 
kann festgestellt werden, ob die SET-Region eine Do- durch Reaktivierung eines Pseudogens zurackzufUhren 
mane darstellt, die aufgrund von Wechselwirkungen 65 ist - durch Einfflhrung der funktionellen Gensequenz 
funktiomert, oder ob sie zum Entstehen multimerer he- durch Inhibierung der Genexpression, z. B. mit Hilfe von 
terochromatischer Komplexe beitragt Ebenso kann Antisenseoligonukleotiden, oder durch Einfflhrung ei- 
festgestellt werden, ob die SET-Domane eine inhibitori- ner fflr eine dominant-negative Mutante kodierenden 
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Sequenz. Die Einfuhrung der jeweiligen DNA-Sequen- 
zen in die Zelle kann mit Hilfe von Standardmethoden 
fflr die Transfektion hdherer eukaryotischer Zellen er- 
folgen, zu denen der Gentransfer mitteis viraier Vekto- 
ren (Retrovirus, Adenovirus, Adeno-assoziiertes Virus) 
oder mitteis nicht-viralen Systemen auf Basis der Re- 
zeptor-vermittelten Endozytose zahlen; Obersichten 
iiber gebrauchliche Methoden werden z. B. von Mitani 
und Caskey, 1993; Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zadoukal et al, 1993, 
WO 93/07283 gegeben. 

FQr eine Inhibierung der Expression der erfindungs- 
gemaflen Gene kommen auch niedermolekulare Sub- 
stanzen in Betracht, die in die Transkriptionsmaschine- 
rie eingreifen; nach Analyse der 5'-regulatorischen Re- 
gion der Gene kann nach Substanzen gescreent werden, 
die die Wechselwirkung der jeweiligen Transkriptions- 
faktoren mit dieser Region ganz oder teilweise blockie- 
ren, z. B. mit Hilfe der in der Wo 92/13092 beschriebe- 
nen Methode. 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechen- 
den Antik6rper gegen das HEZ-2- oder H3— 9-Protein, 
vorzugsweise humane oder humanisierte Antik6rper, 
therapeutisch eingesetzt werden. Die Herstellung sol- 
cher Antikdrper erfolgt nach bekannten Methoden, wie 
sie z. B. von Malavsi und Albertini, 1992, oder von Rhein, 
1 993, beschrieben wurden 

Antikorper gegen HEZ-2 oder H3-9, die therapeu- 
tisch oder diagnostisch verwendet werden konnen, sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Figurenflbersicht 

Fig. 1 Aminosaure-Sequenzvergleich zwischen 
HEZ-2 und E(z), 

Fig. 2 Aminosaure-Sequenzvergleich zwischen 
H3-9undSu(var)3-9, 

Fig. 3 Aberrante Transkripte von humanen SET-Do- 
mane-Genen, 

Fig. 4 Evolutionare Konservierung von SET-Doma- 
ne-Proteinen, 

Fig. 5 Aminosaure-Obereinstimmung in der SET-Do- 
mane, 

Fig. 6 DNA-Sequenz von HEZ-2, 
Fig. 7 DNA-Sequenz von H3-9, 
Fig. 8 Sequenzvergleich zwischen den cDNAs von 
humanem HEZ-2 und REZ-1. 

Beispiel 

a) Herstellung einer cDNA-Bibliothek 

Es wurde eine humane B-Zell-spezifische cDNA-Bi- 
bliothek, wie von Bardwell und Treisman, 1994, be- 
schrieben, hergestellt, indem Poly(A) + -RNA aus huma- 
nen BJA-B-Zellen isoliert, mitteis Poly(dT)i5-Priming re- 
vers transkribiert und in doppelstrangige cDNA kon- 
vertiert wurde. Nach Zugabe eines EcoRI- Adapters der 
Sequenz 5' AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI-Stelle des Bakteriophagen XgtlO 
ligiert Die Propagierung und Amplifizierung der Bi- 
bliothek erfolgte in Ecoli C600. 

b) Herstellung von DN A-Sonden 

Drosophila-DNA-Sonden, kodierend fur die konser- 
vierten SET-Domanen von E(z) und Su(var)3— 9, wur- 
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den auf der Grundlage der publizierten Drosophila-Se- 
quenzen (Jones und Gelbart, 1993; Tschiersch et al, 
1994) mitteis Polymerasekettenreaktion (PCR) herge- 
stellt: 1 ug von Drosophila melanogaster-DNA (Clon- 

5 tech) wurde mit den beiden Primern E(z) 1910 (5' ACT- 
GAATTCGGCTGGGGCATCTTTCTTAAGG) und E( 
z) 2280 (5' ACTCTAGACAATTTCCATTT- 
CACGCTCTATG) einer PcR-Amplifikation (35 Zyklen 
zu 30 sek bei 94°C, 30 sek bei 55°C und 30 sek bei 72°C) 

to unterworfen. Die entsprechende SET-Domane-Sonde 
fur Su(var)3-9 wurde von 10 ng Plasmid-DNA 
(Tschiersch et al, 1994; Klon M4) mit dem Primerpaar 
suvar.up (5' ATATAGTACTTCAAGTCCATTCAA- 
AAGAGG) und suvandn (5' 

is CCAGGTACCGTTGGTGCTGTTTAAGACCG) am- 
plifiziert, wobei dieselben Zyklusbedingungen verwen- 
det wurden Die erhaltenen SET-Domane-DNA-Frag- 
mente wurden Gel-gereinigt und teilsequenziert, um die 
Richtigkeit der amplifizierten Sequenzen zu bestatigen 

20 

c) Screenen der cDNA-Bibliothek 

5 x 10 5 Plaque-bildende Einheiten ("plaque forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 

25 Wirtsstammes E.coli C600 (bei einer optischen Dichte 
ODgoo von 05 in 10 mM MgS0 4 suspendiert) bei 37°C 
15 min lang inkubiert und dann auf eine groBe (200 mm 
x 200 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum iiber Nacht bei 37° C wurden die Phagen auf 

30 einer Nylonmembran (GeneScreen) absorbiert Die 
Membran wurde, die Seite mit den absorbierten Phagen 
nach oben schauend, 30 sek lang in Denaturierungslo- 
sung (15 M NaCl, 05 M NaOH) schwimmen gelassen, 
dann 60 sek in Denaturierungslosung eingetaucht und 

35 abschlieBend 5 min lang in 3 M NaCl, 05 M Tris pH 8, 
neutralisiert Dann wurde die Membran kurz in 3 x SSC 
gespult und die Phagen-DNA mitteis UV-Vernetzung 
auf das Nylonfilter fixiert Das Filter wurde 30 min lang 
bei 50°C in 30 ml Church-Puffer (1% BSA, 1 mM EDTA 

40 und 0.5 M NaHPCM, pH 72) prahybridisiert, anschlie- 
Bend wurden 2 x 10 6 cpm der radioaktiv markierten 
DNA-Sondenmischung (E(z)-SET und 

Su(var)3-9-SET) zugegeben; die DNA-Sonden wurden 
durch Random-priming unter Verwendung des RediPri- 

45 me-Kit (Amersham) hergestellt Die Hybridisierung 
wurde Qber Nacht bei 50° C durchgeftlhrt Nach Entfer- 
nung der Hybridisierungsldsung wurde das Filter 10 sek 
in 2xSSC 1% SDS bei Raumtemperatur gewaschen, 
anschlieBend wurde 10 sek lang bei 50° C gewaschen. 

so Das Filter wurde in Saranwrap gewickelt und unter 
Verwendung einer Verstarkerfolie der Autoradiogra- 
phic unterworfen. 

Positive Phagenkolonien wurden auf der Original- 
platte mitteis Zuordnung des Autoradiogramms identi- 

55 fiziert und die entsprechenden Agarstuckchen mit dem 
groBeren Ende einer Pasteur-Pipette entfernt Der Pha- 
gen-Pool wurde Qber Nacht bei 4°C in 1 ml SM-Puffer 
(5,8 g NaCl, 2g MgSCvHzO, 50 ml Tris pH 75, 5 ml 
2%ige Gelatine auf 1 1 H 2 0), enthaltend einige Tropfen 

eo CHCI3, eluiert. Das Phagenlysat wurde fur eine zweite 
und dritte Screeningrunde wieder ausplattiert um ein- 
zelne, gut isolierte positive Plaques (20 bis 100 Plaques 
pro Platte in der dritten Runde) zu erhalten. 

65 d) Sequenzanalyse 

Die cDNA-Inserts von rekombinanten Phagen wur- 
den in den Polylinker von pBluescript KS (Stratagene) 
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subkloniert und auf einem automatischen Sequenzer 
(Applied Biosystems) unter Verwendung der Didesoxy- 
Methode sequenziert Die komplette Sequenz von we- 
nigstens zwei unabhangigen Isoiaten pro erhaltenen 
Gen wurde mittels "Primer walking" ermittelt Die Se- 
quenzen wurden mit dem GCG-Software-Paket (Uni- 
versity of Wisconsin) analysiert, die Untersuchung auf 
Homologie wurde mit dem "Blast and fasta" oder "tfa- 
sta" Netzwerkservice durchgefuhrt Die kompletten Se- 
quenzen von HEZ-2 und H3-9 sind in Fig. 6 und 7 
dargestellt 
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Patentansprttche 

1. DNA-MolekQIe, enthaltend eine fUr ein Chro- 
matinregulator-Protein, das eine SET-Domane auf- 
weist, kodierende Sequenz oder eine Teilsequenz 65 
davon, dadurch gekennzeichnet, da8 sie die in 
Fig. 6, Fig. 7 oder Fig. 8 dargestellte Nukleotidse- 
quenz, kodierend fur HEZ-2, H3-9 oder HEZ-1 
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einschlieBIich ihrer degenerierten Varianten sowie 
Mutanten davon, enthalten. 

2. DNA-Molekul nach Anspruch 1, dadurch ge- 
kennzeichnet, daB es eine cDNA ist 

3. DNA-Molekul nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, daB es humanen Ursprungs ist 

4. cDNA nach Anspruch 3 der Bezeichnung HEZ-2. 

5. cDNA nach Anspruch 3 der Bezeichnung H3-9. 

6. DNA-Molekul nach Anspruch 4, dadurch ge- 
kennzeichnet, daB es die fur die SET-Domane von 
HEZ-2 kodierende Region oder einen Abschnitt 
davon enthalt 

7. DNA-MolekQl nach Anspruch 5, dadurch ge- 
kennzeichnet, daB es die fiir die SET-Domane 
H3-9 kodierende Region oder einen Abschnitt da- 
von enthalt 

8. DNA-Molekul nach Anspruch 4, dadurch daB es 
fur eine dominant-negative Mutante von HEZ-2 
kodiert. 

9. DNA-Molekiil nach Anspruch 4, dadurch daB es 
fur eine dominant-negative Mutante von H3-9 ko- 
diert 

10. Rekombinantes DNA-MolekuL enthaltend eine 
in Anspruch 2 definierte cDNA, funktionell verbun- 
den mit Expressionskontrollsequenzen, zur Expres- 
sion in prokaryotischen oder eukaryotischen Wirts- 
organismen. 

11. Prokaryotische oder eukaryotische Wirtsorga- 
nismen, transformiert mit rekombinanter DNA 
nach Anspruch 10. 

12. Rekombinantes humanes Chromatinregulator- 
Protein HEZ-2 oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 4 definierten 
cDNA. 

13. Rekombinantes humanes Chromatinregulator- 
Protein H3-9 oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 definierten 
cDNA. 

14. Antik6rper gegen HEZ-2. 

15. AntikSrper gegen H3-9. 

16. Antisense(desoxy)ribonukleotide mit Komple- 
mentaritat zu einer Teilsequenz einer in Anspruch 
1 definierten DNA. 

17. DNA-MolekflL kodierend fiir die SET-Domane 
eines Chromatinregulator-Gens, bzw. fiir einen Ab- 
schnitt davon, zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine Deregu- 
lation von Chromatinregulator-Genen, die eine 
SET-Domane aufweisen, zurilckzuftihren sind. 

18. DNA-MolekOl nach Anspruch 6 oder 7 zur Be- 
handlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von Chromat- 
inregulator-Genen, die eine SET-Domane aufwei- 
sen, zurtickzufiihren sind. 

19. Antikarper nach Anspruch 14 oder 15 zur Be- 
handlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von Chromat- 
inregulator-Genen, die eine SET-Domane aufwei- 
sen, zurflckzufuhren sind. 

20. Transgene Maus, enthaltend ein Transgen fiir 
die Expression eines Chromatinregulator-Gens, das 
eine SET-Domane aufweist oder einer mutierten 
Version eines solchen Proteins. 

21. Transgene Maus, erhaltlich aus embryonalen 
Stammzellen, in denen die endogenen Maus-Loci 
fCr HEZ-2 und H3-9 durch homologe Rekombi- 
nation unterbrochen wurden. 

22. Verfahren zum Identifizieren von Saugetier- 
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Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, oder mutierten Versionen davon, da- 
durch gekennzeichnet, daB man Saugetier-cDNA- 
oder genomische DNA-Bibliotheken unter Bedin- 
gungen niedriger Stringenz mit einem DNA-Mole- 
kfll, kodierend fur die SET-Domane oder einen Ab- 
schnitt davon, hybridisiert 
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Fig. 1 



HEZ-2 1 MGQTGKKSiXGPVOmKRVKSEYMRLRQLKRfRRADEVKSMFSSNRQKIL 50 

E(Z) 1 MNSTKVPPEWKRRVKSEYIKIRQQKRYKRADEIKEAWIRNWDEHN 45 

51 ERTEILNCEWXQRRIQPVHILTSVSSLRGTHECSVTSDLDrP. -TQVIPL 98 

46 HNVQDLYCESKVWQAKPYD PPHVDCVKRAEVTSYNGIPSGPQKVPI 91 

99 KTLNAVASVPIMYSWSPLQQNFMVEDETVLHNIPYMGOEVLDQDGTFIEE 148 
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192 TEP LAKSK 2GED DGWDVDADCESPMKLEKTESKGD LT DVEKKETEEP VE 241 

207 RDDKESRPPRK FPSDKIFEAISSMFPDKGTAEELKEKYKELTE 249 
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242 TSDADVKr AVSEVKDKLPFP AP 1 1 FQAI SANFPDKGTAQELXEKY IELTE 291 

250 QQLPGAL?=^CPNIDGPNAKSVQREQSLHSFHTLi^«^KYE#LHPF 299 

'i I : •Mllllll .1.11 II..: Illlllllll.: 

292 K2DPER. = ;H»?NIDGIKAESVSRERTMHSFHT1.^Ui^-XYC0 , LHRL 340 

300 . .KATPNriK.^<OTETALDNKP@SPC^CKLEGAKZFAAALTAERIKTPP 347 
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341 0GHAGPN13K5aYPEIj?PFAEP^NS®fMLIDGMK2SLAA DSKTPP 386 

348 KS?GGR.^3R^?SSSSR?STPT:NVLES:0TDSCRIAGTETGGENNDKEE 397 
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Fig. 5 

E(z) SDIAGSGIFL KEGAQKNEFI SEYCGEIISQ DEADRRGKVY DK . . YMCSFL 50 
KEZ SDVAGWGIFI KDPVQKNEFI SEYCGEIISQ DEADRRGKVY DK..YMCSFL 

W*- m si B 1 4 

KRX SPIHGRGLFC KRNIDAGEMV ISXAGNVXRS IQXDKREKYY DSXC-IG.CYM 

trx SHIHGRGXYC TKDIEAGEMV IBYAGELIRS TLTDKRF.RYY DSRGIG.CYM 

C26 SRIHGWGLYA MESIAPDEMI VE&GpTiilS LVpEEEKAy ERRGIGSSYL 

YHR SAIHNWGLYA LDSIAAKEMI ISYVGERIRQ ? V&EMRE KR Y LKNC-IGSSYL 

: i 111 ill 

SU3-9 ANGSGSGVRA ATALRKGEFV C^Z^I|TS DEMJESGKAX DDKG..RTYL 

H3-9 DDGRGWGVRT LEKIRKNSFV MEYVGEIITS EEAERRGQIY DRQG..ATYL 

G9a TAKMGWGVRA LQTIPQGTFI CsfMffiLlSD AESb.l.vJj .RED..DSYL 

KG-1 TQNKGWQIIRC LDDIAKGSFV cf$L§a§rD &F§U$SX»1 .EMG. .DEXF 



E(z) WW NDFWDATRK CNKIB|aH|S IN|gCYAKVM MVTGDH 10C 

EEZ ENLN NDFWDATRK GKKIIWA^S VNFKCYAKVM MVN'GDH 

KRX FRID DSEWDATMH pWRAI^I^S CaSiCYSRVI NK3QK 

trx FK ID DNLWDATMR GNAARFINHC CEpCYSKW DI1GHK 

C26 FRID LHHVIDATKR 'SNFAi#l|fiS CQ&YAKVL TIE3EK 

YHR ERVD ENTVICATKK GGIARFISKC CDPJCTAKII KVC-3RR 

Su3-9 FPLDYNTACD SSYTIDAANY GHISKFINHS Cd|$LAVF?C WIIHLNVAl? 

K3-9 FDLDY...VE DVYTVDAAYY GNISH£y$|s CDPKLQVYNV FIELDER!? 

G9a FDLDNK . . DG EVYCIDARYY GNISREINEjlr CDPHIIPVRV FM1HQDLRF? 

KG-1 ANLDH I . . £ S V2YIIDAKLE ^LGKnMgS CSl^fLFVCNV FV~ THDLRF? 



Z(z) RJGIFAKRAI QP^EEIJ-FDY . . RYGP7EQL K FVGI Er-iMSIV* 13". 

HEZ RIGIEAKgAI QTGEELFFDX . . RYSQADAL K YVGI ERZMEIP* 

KRX HIVXFAHRM YRSKSiTYDY . .KFPIE. DA SNKLPCNCGA KXCRKFLN* 

trx HUI^v|R| VQ^I/CYDi ..KFPFE.D. .EKIPCSCGS KRCRKYLN" 

C26 R|viX5R£l| IXBjgjwim ..KFPIE... DDKIDCLCGA KTCRGYLN* 

YHR R|Vl^VL«» AASBSi/TYlli ..KFEREKDD EERLPCLCGA PNCXGFLN* 

Su3-9 HliVFraL^I KA^IiSFS . IRADNEDVP YENLSTA 

H3-9 RIAFFATRtI RAlpeLiTFI^ NMQVDPVDME STRMDSNFGL AGZ.PGSPKKR 

G9a RXAFMSSRDI RTG^LGFt^ GDRFW. .DIK SKYFTCQCGS EKCXHSAEAI 

KG-1 WVAr FA3KRI RAGIEiTWDY N'YEVG . . SVE GKELLCCCGA IE:?. 



E(Z) 
HEZ 

HRX 

26 
YHR 

3u3-9 VRVECRCGRD .VCRKVIF- 

H3-9 VRIECKCGTE SCRKYLF* 

33a ALEQSRLARL :?HPE1^?EL G3LPPVNT* 

KG-1 GRLL* 
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HSZ-2 Length: 2607bp 



(CODING: 90-2330) 



1 AGGCAG7GGA GCCCCGGCGG CGGCGGCGGC GGCGCGCGGG GGCGACGCGC 

M 

51 GGGAACAACG CGAGTCGGCG CGCGGGACGA AGAATAAT CA TC-G GCCAGAC 

101 TGGGAAGAAA TCTGAGAAGG GACCAGTTTG TTGGCGGAAG CGTGTAAAAT 

151 CAGAGTACAT GCGACTGAGA CAGCTCAAGA GGTTCAGACG AGCTGATGAA 

201 GTAAAGAGTA TGTTTAGTTC CAATCGTCAG AAAATTTTGG AAAGAACGGA 

251 AATCTTAAAC CAAGAATGGA AACAGCGAAG GATACAGCCT GTGCACATCC 

301 TGACTTCTGT GAGCTCATTG CGCGGGACTA GGGAGTGTTC GGTGACCAGT 

351 GACTTGGATT TTCCAACACA AGTCATCCCA TTAAAGAC7C TGAATGCAGT 

401 TGCTTCAGTA CCCATAATGT ATTCTTGGTC TCCCCTACAG CAGAATT7TA 

451 TGGTGGAAGA TGAAACTGTT TTACATAACA TTCCTTATAT GGGAGATGAA 

501 GTTTTAGATC AGGATGGTAC TTTCATTGAA GAACTAATAA AAAATTATGA 

551 TGGGAAAGTA CACGGGGATA GAGAATGTGG GTTTATAAAT GATGAAATTT 

601 TTGTGGAGTT GGTGAATGCC CTTGGTCAAT ATAATGATC-A TGACGAT3AT 

651 GATGATGGAG ACGATCCTGA AGAAAGAGAA GAAAAGCAC-A AAGATC73GA 

701 GGATCACCGA GATGATAAAG AAAGCCGCCC ACC7CGGAAA TTTCCTTCTG 

751 ATAAAATTTT TGAAGCCATT TCCTCAATGT TTCCAGATAA GGGCACAGCA 

801 GAAGAACTAA AGGAAAAATA TAAAGAACTC ACCGAACAGC AGCTCCCAGG 

851 CGCACTTCCT CCTGAATGTA CCCCCAACAT AGATGGACCA AATGCTAAAT 

901 CTGTTCAGAG AGAGCAAAGC TTACACTCCT TTCATACGCT TTTCTGTAGG 

951 CGATGTTTTA AATATGACTG CTTCCTACAT CCTTTTCATG CAACACCCAA 

1001 CACTTATAAG CGGAAGAACA CAGAAACAGC TCTAGACAAC AAACCTTGTG 

1051 GACCACAGTG TTACCAGCAT TTGGAGGGAG CAAAGGAGTT TGCTGCTGCT 

1101 CTCACCGCTG AGCGGATAAA GACCCCACCA AAACGTCCAG GAGGCCGCAG 

1151 AAGAGG.-.CGG CTTCCCAATA ACAGTAGCAG GCCCAGCACC CCCACCATTA 

1201 ATGTGC7GGA ATCAAAGGAT ACAGACAGTG ATAGGGAAC-C AGGGAC7GAA 

1251 ACGGGGGGAG AGAACAATGA TAAAGAAGAA GAAGAGAAGA AAG AT GAAAC 

1301 TTCGAGCTCC TCTGAAGCAA ATTCTCGGTG TCAAACACCA ATAAAGATGA 

1251 AGCCAAATAT 7GAACCTCCT GAGAATGTGG AGTGGAGT" TC-~7GA>.:-CC 
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1401 


TCAATGTTTA 


GAGTCCTCAT 


TGGCACTTAC 


TATGACAATT 


TCTGTGCCAT 


1451 


TGCTAGGTTA 


ATTGGGACCA 


AAACATGTAG 


ACAGGTGTAT 


GAGTTTAGAG 


1501 


TCAAAGAATC 


TAGCATCATA 


GCTCCAGCTC 


CCGCTGAGGA 


TGTGGATACT 


1551 


CCTCCAAGGA 


AAAAGAAGAG 


GAAACACCGG 


TTGTGGGCTG 


CACACTGCAG 


1601 


AAAGATACAG 


CTGAAAAAGG 


ACGGCTCCTC 


TAACCATGTT 


TACAACTATC 


1651 


AACCCTGTGA 


TCATCCACGG 


CAGCCTTGTG 


ACAGTTCGTG 


CCCTTGTGTG 


1701 


ATAGCACAAA 


ATTTTTGTGA 


AAAGTTTTGT 


CAATGTAGTT 


CAGAGTGTCA 


1751 


AAACCGCTTT 


CCGGGATGCC 


GCTGCAAAGC 


ACAGTGCAAC 


ACCAAGCAGT 


1801 


GCCCGTGCTA 


CCTGGCTGTC 


CGAGAGTGTG 


ACCCTGACCT 


CTGTCTTACT 


1851 


TGTGGAGCCG 


CTGACCATTG 


GGACAGTAAA 


AATGTGTCCT 


GCAAGAACTG 


1901 


CAGTATTCAG 


CGGGGCTCCA 


AAAAGCATCT 


ATTGCTGGCA 


CCATCTGACG 


1951 


TGGCAGGCTC- 


GGGGATTTTT 


ATCAAAGATC 


CTGTGCAGAA 


AAATGAATTC 


2001 


ATCTCAGAAT 


ACTGTGGAGA 


GATTATTTCT 


CAAGATGAAG 


CTGACAGAAG 


2051 


AGGGAAAGTG 


TATGATAAAT 


ACATGTGCAG 


CTTTCTGTTC 


AACTTGAACA 


2101 


ATGATTTTGT 


GGTGGATGCA 


ACCCGCAAGG 


GTAACAAAAT 


TCGTTTTGCA 


2151 


AATCATTCGG 


TAAATCCAAA 


CTGCTATGCA 


AAAGTTATGA 


TGGTTAACGG 


2201 


TGATCACAGG 


ATAGGTATTT 


TTGCCAAGAG 


AGCCATCCAG 


ACTGGCGAAG 


2251 


AGCTGTTTTT 


TGATTACAGA 


TACAGCCAGG 


CTGATGCCCT 


GAAGTATGTC 


2301 


GGCATCGAAA 


GAGAAATGGA 


AATCCCTTGA 


CATCTGCTAC 


CTCCTCCCCC 


2351 


TCCTCTGAAA 


CAGCTGCCTT 


AGCTTCAGGA 


ACCTCGAGTA 


CTGTGGGCAA 


2401 


TTTAGAAAAA 


GAACATGCAG 


TTTGAAATTC 


TGAATTTGCA 


AAGTACTGTA 


2451 


AGAATAATT7 


ATAGTAATGA 


GT7TAAAAAT 


CAACTTTTTA 


TTGCCrrCTC 


2501 


ACCAGCTGCA 


AAGT3TTTTG 


TACCAGTGAA 


TTTTTGCAAT 


AATGCAGTAT 


2551 


GGTACATTTT 


TCAACTTTGA 


ATAAAGAATA 


CTTGAACTTG 


TCAAAAAAAA 


2601 


TGTCGAC 
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H3-9 LENGTH : 2747bp (CODING: 53-1291) 

1 GTCGACACTC GCGAGGCCGG CTAGGCCCGA ATGTCGTTAG CCGTGGGGAA 

M 

51 AGATGGCGGA AAATTTAAAA GGCTGCAGCG TGTGTTGCAA GTCTTCTTGG 

101 AATCAGCTGC AGGACCTGTG CCGCCTGGCC AAGCTCTCCT GCCCTGCCCT 

151 CGGTATCTCT AAGAGGAACC TCTATGACTT TGAAGTCGAG TACCTGTGCG 

201 ATTACAAGAA GATCCGCGAA CAGGAATATT ACCTGGTGAA ATGGCGTGGA 

251 TAT CC AG ACT CAGAGAGCAC CTGGGAGCCA CGGCAGAATC TCAAGTGTGT 

301 GCGTATCCTC AAGCAGTTCC ACAAGGACTT AGAAAGGGAG CTGCTCCGGC 

351 GGCACCACCG GTCAAAGACC CCCCGGCACC TGGACCCAAG CTTGGCCAAC 

401 TACCTGGTGC AGAAGGCCAA GCAGAGGCGG GCGCTCCGTC GCTGGGAGCA 

451 GGAGCTCAAT GCCAAGCGCA GCCATCTGGG ACGCATCACT GTAGAGAATG 

501 AGGTGGACCT GGACGGCCCT CCGCGGGCCT TCGTGTACAT CAATGAGTAC 

551 CGTGTTGGTG AGGGCATCAC CCTCAACCAG GTGGCTGTGG GCTGCGAGTG 

601 CCAGGACTGT CTGTGGGCAC CCACTGGAGG CTGCTGCCCG GGGGCGTCAC 

651 TGCACAAGTT TGCCTACAAT GACCAGGGCC AGGTGCGGCT TCGAGCCGGG 

701 CTGCCCATCT ACGAGTGCAA CTCCCGCTGC CGCTGCGGCT ATGACTGCCC 

751 AAATCGTGTG GTACAGAAGG GTATCCGATA TGACCTCTGC ATCTTCCGGA 

801 CGGATGATGG GCGTGGCTGG GGCGTCCGCA CCCTGGAGAA GATTCGCAAG 

85.1 AACAGCTTCG TCATGGAGTA CGTGGGAGAG ATCATTACCT CAGAGGAGGC 

901 AGAGCGGCGG GGCCAGATCT ACGACCGTCA GGGCGCCACC TACCTCTTTG 

951 ACCTGGACTA CGTGGAGGAC GTGTACACCG TGGATGCCGC CTACTATGGC 

1001 AACATCTCCC ACTTTGTCAA CCACAGTTGT GACCCCAACC TGCAGGTGTA 

1051 CAACGTCTTC ATAGACAACC TTGACGAGCG GCTGCCCCGC ATCGCTTTCT 

1101 TTGCCACAAG AACCATCCGG GCAGGCGAGG AGCTCACCTT TGATTACAAC 

1151 ATGCAAGTGG ACCCCGTGGA CATGGAGAGC ACCCGCATGG ACTCCAACTT 

1201 TGGCCTGGCT GGGCTCCCTG GCTCCCCTAA GAAGCGGGTC CGTATTGAAT 

1251 GCAAGTGTGG GACTGAGTCC TGCCGCAAAT ACCTCTTC TA GC CCTTAGAA 

1301 GTCTGAGGCC AGACTGACTG AGGGGGCCTG AAGCTACATG CACCTCCCCC 

13 51 ACTGCTGCCC "CCTGTCGAG AATGACTGCC AGGGCCTCGC CTGCCTCC.-.C 
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14 01 CTGCCCCCAC CTGCTCCTAC CTGCTCTACG TTCAGGGCTG TGGCCGTGGT 
1451 GAGGACCGAC TCCAGGAGTC CCCTTTCCCT GTCCCAGCCC CATCTGTGGG 
1501 TTGCACTTAC AAACCCCCAC CCACCTTCAG AAATAGTTTT TCAACATCAA 
1551 GACTCTCTGT CGTTGGGATT CATGGCCTAT TAAGGAGGTC CAAGGGGTGA 
1601 GTCCCAACCC AGCCCCAGAA TATATTTGTT TTTGCACCTG CTTCTGCCTG 
1651 GAGATTGAGG GGTCTGCTGC AGGCCTCCTC CCTGCTGCCC CAAAGGTATG 

1701 GGGAAGCAAC CCCAGAGCAG GCAGACATCA GAGGCCAGAG TGCCTAGCCC 

1751 GACATGAAGC TGGTTCCCCA ACCACAGAAA CTTTGTACTA GTGAAAGAAA 

1801 GGGGTCCCTG GCCTACGGGC TGAGGCTGGT TTCTGCTCGT GCTTACAGTG 

1851 CTGGGTAGTG TTGGCCCTAA GAGCTGTAGG GTCTCTTCTT CAGGGCTGCA 

1901 TATCTGAGAA GTGGATGCCC ACATGCCACT GGAAGGGAAG TGGGTGTCCA 

1951 TGGGCCACTG AGCAGTGAGA GGAAGGCAGT GCAGAGCTGG CCAGCCCTGG 

2001 AGGTAGGCTG GGACCAAGCT CTGCCTTCAC AGTGCAGTGA AGGTACCTAG 

2051 GGCTCTTGGG AGCTCTGCGG TTGCTAGGGG CCCTGACCTG GGGTGTCATG 

2101 ACCGCTGACA CCACTCAGAG CTGGAACCAA GATCTAGATA GTCCGTAGAT 

2151 AGCACTTAGG ACAAGAATGT GCATTGATGG GGTGGTGATG AGGTGCCAGG 

2201 CACTAGGTAG AGCACCTGGT CCACGTGGAT TGTCTCAGGG AAGCCTTGAA 

2251 AACCACGGAG GTGGATGCCA GGAAAGGGCC CATGTGGCAG AAGGCAAAGT 

2301 ACAGGCCAAG AATTGGGGGT GGGGGAGATG GCTTCCCCAC TATGGGATGA 

2351 CGAGGCGAGA GGGAAGCCCT TGCTGCCTGC CATTCCCAGA CCCCAGCCCT 

2401 TTGTGCTCAC CCTGGTTCCA CTGGTCTCAA AAGTCACCTG CCTACAAATG 

2451 TACAAAAGGC GAAGGTTCTG ATGGCTGCCT TGCTCCTTGC TCCCCCACCC 

2501 CCTGTGAGGA CTTCTC7AGG AAGTCCTTCC TGACTACCTG TGCCCAGAGT 

2551 GCCCCTACAT GAGACTGTAT GCCCTGCTAT CAGATGCCAG ATCTATGTC-T 

2601 CTGTCTGTGT G7CCATCCCG CCGGC~CCC AGACTAACCT CCAG3CATC-3 

2 651 ACTGAATCTG GTTCTCCTCT TGTACACCCC TCAACCCTAT GCAGCCTGGA 

27 01 GTGGGCATCA A7AAAATGAA CTGTC3ACTG AAAAAAAAAA 7GTCGAC 
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